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往 要: 考 记 腹 票选 有 职 的 多 因子 问题 ， 站 传统 模型 所 基础 上 ， 刑 用 MA4TLAB 皆 伯 建立 使 用 加 权 右 入 ( 权 


内 日 舰 科 涨 饼 居 综 合 快 定 ) 的 股票 去 下 而 指标 、 贡 大 指标 对 柏村 收 蔓 亡故 多 因子 模型 


， 浊 日 3/ 入 区 村 向 晶 


机 作为 风 雁 ， 密 和 终 获 得 了 一 个 收益 区 好 的 量化 扫 资 模型。 
05/ 每 
如 何 科学 地 进行 投资 是 市 场 经 久 不 衰 的 研究 话题 ， 而 随 着 量化 投资 的 概念 在 世界 范围 
内 兴起 ， 各 种 量化 投资 的 方法 也 逐渐 受到 中 国 投资 者 的 关注 ， 另 一 方面 ， 量 化 投资 的 思想 
也 逐渐 为 投资 者 所 接受 ， 开 始 成 为 证 券 界 的 研究 热点 。 
本 文 将 以 研究 热点 多 因子 模型 为 基础 使 用 统计 学 中 的 加 权 回 归 方 法 对 模型 进行 了 改良 ， 
之 后 又 使 用 了 支持 向 量 机 的 算法 来 对 风险 进行 控制 。 
1 综 砍 
多 因子 模型 最 早 来 源 于 詹 森 提出 的 Alpha 收益 概念 ， 这 一 概念 来 自 于 詹 森 对 CAPM 模 
型 的 扩充 模型 如 下 : 
(1) 
其 中 ， 代 表 着 资产 的 实际 收益 率 ， 代 表 市 场 组 合 预 期 收益 率 ; 
之 后 在 1993 年 Fama 和 French 提出 了 Fama-French 选 股 模型 ， 这 一 模型 表达 式 如 下 : 
(2) 


一 模型 可 以 看 作 目 前 广泛 使 用 的 多 因 


规模 市 场 中 因 


子 模型 的 纵 形 


形 ， 


子 组 合 收益 率 ， 常 用 大 小 市 值 股票 


因子 的 敏感 度 ， 而 表示 
的 敏感 度 。 


对 规模 
价值 因子 
经 过 


国内 


型 只 能 


得 指标 被 投资 


股市 中 还 是 存在 一 
并 且 其 并 没有 发 展 成 
述 投资 标的 中 较 小 的 一 部 分 特征 ， 


EE 
万 v2 


究 ，FF 模型 在 匡 
定 的 估 值 效应 和 规模 效应 的 ， 但 是 FF 模型 中 


学 术 界 学 者 的 实证 下 


竺 实际 


其 中 为 无 风险 收益 率 。SMB 为 
组 合 收益 率 之 差 表 示 。HML 为 公司 价值 因 
组 合 的 收益 率 之 差 来 表示 。 其 中 反映 了 这 个 投资 组 合 
组 合 对 价值 因子 的 敏感 度 ， 其 中 的 表示 了 投资 组 合 对 


内 市 场 被 认为 是 有 效 的 ， 也 就 是 说 中 国 


完整 的 理 


在 实际 投资 领 


者 所 使 用 和 信赖 。 我 


统 理论 中 ， 


由 


于 投资 者 交易 理念 、 信 息 环 境 等 因素 的 区 别 ， 


页 域 还 有 这 


基于 美 


论 体系 来 对 市 场 中 所 有 股票 的 情况 加 以 解释 ， 
文 更 多 的 基本 面包 
国 的 学 者 也 做 了 许多 相关 的 基于 A 股市 场 的 验证 ， 


应 用 也 有 自 


己 的 不 足 ， 
并 且 三 


因子 模 


技术 变 
在 传 


玉 | 


成 熟 的 


股票 市 场 的 数 


市 场 经 验 有 较 大 区 别 。 在 参考 文献 [1] 中 ， 赵 胜 民 等 


据 为 样本 进行 分 析 的 资产 定价 模型 往往 与 新 兴 资 本 市 场 有 所 不 同 。 近 期 ， 在 参考 文献 [2] 中 ， 
田 利 辉 等 人 研究 了 五 因子 模型 在 中 国 证 券 市 场 中 的 表现 ， 并 且 发 现 我 国 的 定价 因素 与 美国 


人 研究 了 Fama，French 在 2015 提出 的 


子 模型 的 结论 。 


五 因子 模型 在 中 国 A 股市 场 中 的 表现 ， 得 出 了 虽然 具有 一 定 的 有 效 性 但 是 表现 却 不 如 三 因 


为 了 对 FF 模型 进行 补充 ， 出 现 了 多 因子 选 股 模型 ， 其 基本 假定 就 是 股票 的 未 来 走势 将 


是 其 历史 的 重演 ， 并 且 股 票 的 收益 率 受 到 上 市 公司 财务 指标 及 一 些 行情 指标 的 影响 ， 多 因 


子 选 股 模型 就 是 一 句 一 定 的 条 件 ， 筛 选 出 可 以 战胜 市 场 的 投资 组 合 。 其 模型 如 下 : 


在 实践 之 中 ， 往 往 使 用 多 元 线性 回归 的 方法 对 进行 求解 ， 往 往 使 用 最 小 二 乘法 即 等 价 


| 


于 求解 如 下 问题 


我 们 提出 了 在 回归 时 使 用 加 权 回 归 的 方式 进行 求解 ， 那 么 问题 转化 为 : 


在 模型 之 中 相当 于 对 模型 的 惩罚 因子 进行 加 权 ， 


即 不 是 把 每 一 天 看 的 同等 重要 ， 只 是 


在 计算 时 要 对 wG) 同 时 进行 考虑 。 股 票 市 场 是 经 济 的 晴雨 表 ， 其 有 一 定 的 周期 性 特点 ， 所 


以 在 回归 的 过 程 中 首先 就 是 距离 预测 时 间 较 近 的 日 期 应 该 子 以 较 大 的 权重 ， 考虑 的 股 
票 的 周期 性 ， 如 果 取 周期 是 两 年 的 话 ， 那 么 相应 的 两 年 前 的 数据 自然 应 该 比 一 年 前 的 数据 


取 更 大 的 权 习 


HI 


。 而 且 对 于 涨 跌幅 来 说 惩罚 系数 也 应 有 相应 的 考量 ， 因 为 在 波动 不 那么 剧烈 


的 时 候 ， 即 使 预测 出 现 偏差 也 不 会 带 来 较 大 的 亏损 ， 


但 是 如 果 错 过 了 较 大 的 涨幅 或 者 没有 


避 开 较 大 的 跌幅 那么 就 会 对 收益 产生 巨大 的 影响 ， 所 以 权重 过 于 涨 跌幅 也 应 该 是 正 相 关 。 


这 是 对 多 因子 模型 的 主体 的 计算 ， 另 一 方面 ， 在 量化 投资 的 过 程 中 最 重要 的 一 点 是 对 
风险 的 控制 ， 即 对 回 撤 的 限制 。 所 以 在 本 文 之 中 使 用 支持 向 量 机 对 风险 进行 控制 。 


支持 向 量 机 (Support Vector Machine，SVM) 是 Corinna Cortes 和 Vapnik 等 人 于 1995 年 首 


点 用 到 函数 拟 合 等 其 他 机 器 学 习 问题 中 。 


先 提出 ， 它 在 解决 小 样本 、 非 线性 及 高 维 模式 识别 中 表现 出 许多 独特 的 优势 ， 并 能 够 推广 


在 机 器 学 习 中 ， 支 持 向 量 机 是 与 相关 的 学 习 算 法 有 关 的 监督 学 习 模型 ， 可 以 分 析 数 据 ， 
识别 模式 ， 用 于 分 类 和 回归 分 析 。 在 股票 预测 中 ， 可 以 将 股票 的 涨 和 跌 看 做 两 种 状态 ， 在 
这 种 情况 下 就 可 以 将 原本 的 连续 性 变量 : 涨 跌幅 变 为 离散 型 的 数据 。 


然 获 得 了 很 好 的 收益 率 但 往往 伴随 着 很 大 的 风险 ， 引 
量 机 预测 结果 表示 未 来 股票 将 会 下 跌 时 ， 则 即使 多 
择 买 入 ， 则 可 获得 平稳 的 超额 收益 。 

本 文 的 主要 贡献 在 于 : 本 文 建立 了 一 个 全 新 而 有 


避 


在 过 去 的 研究 之 中 ， 往 往 使 用 支持 向 量 机 对 大 盘 
在 过 去 学 者 们 的 研究 中 表示 ， 支 持 向 量 机 对 股票 跌幅 的 预测 往往 很 准确 ， 而 多 因子 模 
型 在 回归 的 过 程 中 往往 难以 对 跌幅 方面 进行 很 好 的 防范 ， 这 就 导致 了 在 具体 的 实验 之 中 虽 


指数 进行 预测 ， 也 取得 了 不 错 的 效果 


入 文 持 向 量 机 作为 风险 控制 ， 当 支持 
因子 模型 提示 其 预测 涨幅 较 大 也 不 选 


效 的 量化 投资 模型 并 且 将 新 的 回归 模 


式 引 入 了 多 因子 模型 之 中 。 
2 檬 型 建立 
2.1 传统 因子 模型 


2.1.1 传统 三 因子 模型 


传统 的 三 因子 模型 是 Fama 和 French 在 1993 年 提出 的 。 模 型 认为 
括 单个 股票 ) 的 超额 回报 率 可 1 


市 值 因 子 、 账 面 


值 比 因子 。 


一 


es 
它 对 三 个 因子 的 表现 来 解释 ， 这 三 个 因子 是 : 市 场 资 产 组 合 
这 个 多 因子 均衡 定价 模型 可 以 表示 为 : 


其 中 表示 时 


刁 t 的 无 风险 收益 率 ; 表示 时 间 t 的 市 场 收 益 率 ; 表示 资产 i 在 时 间 1 的 收 
益 率 ， 是 市 场 风 险 溢 价 ， 为 时 间 t 的 市 值 (Size) 因 子 的 模拟 组 合 收 益 率 ， 为 时 间 t 的 账面 市 
直 比 因子 的 模拟 组 合 收益 率 。 


一 


分 别 是 三 个 因子 的 系数 ， 采 用 多 元 回归 的 方式 来 计算 


， 回 归 模 型 表示 如 下 ; 


值得 一 提 的 是 ， 表 示 的 是 三 因子 模型 里 面 尚未 解释 的 超额 收益 。 若 是 三 因 
可 以 完全 解释 各 种 风险 带 来 的 超额 收益 ， 那 么 任何 一 
实 值 应 该 为 0。 


子 模型 已 经 
个 股票 以 及 任何 一 个 投资 组 合 的 的 真 


2.1.2 三 因子 模型 基础 上 的 五 因子 模型 


ll 


因子 模型 在 后 续 的 研究 中 ， 学 者 发 现 许 多 股票 的 值 显著 
的 基础 上 ， 产 生 的 五 因子 模型 ， 回 归 模 型 可 表达 如 下 : 


不 为 0， 于 是 在 三 因子 模型 
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其 中 ， 五 因子 模型 比 三 因子 模型 里 面 多 出 来 了 两 项 : 是 高 / 低 鳃 利 股票 投资 组 合 的 回报 
之 差 ， 而 则 是 低 /高 再 投资 比例 公司 股票 投资 组 合 的 回报 之 差 。 同 样 ， 表 示 的 是 五 因子 模型 
里 面 尚未 解释 的 超额 收益 。 


2.2 多 因子 模型 


2.2.1 多 因子 模型 简介 


多 因子 选 股 模型 是 现在 应 用 比较 广泛 的 一 种 选 股 模型 。 与 之 前 的 模型 不 同 ， 它 进一步 
弱化 了 人 为 选择 影响 因素 的 步骤 。 基 本 原理 就 是 采用 一 系列 的 因子 作为 选 股 标准 ， 满 足 这 
些 因子 的 股票 则 被 买 入 ， 不 满足 的 则 卖 出 。 


通常 来 说 ， 多 因子 选 股 模型 有 两 种 判断 方法 ， 一 是 打分 法 ， 二 是 回归 法 。 我 们 采用 的 
是 线性 回归 的 方法 。 并 在 此 基础 上 ， 创 新 性 地 使 用 了 加 权 线 性 拟 合 的 方法 。 
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2.2.2 使 用 支持 向 量 机 


支持 向 量 机 方法 (SVM) 就 是 从 


, iS 解决 线性 可 分 情况 的 最 优 分 类 出 发 
0 | 的 ， 其 思想 就 是 选取 使 “间隔 ” 达 
0D ei 到 最 大 的 那个 法 方向 ， 相 应 得 到 的 


图 2 线性 可 分 情况 下 的 最 优 分 类 线 


两 条 极端 直线 就 是 最 优 分 类 线 ， 这 


是 SVM 的 核心 思想 之 一 。 具 体 来 说 就 是 ， 对 于 选 定 的 法 方向 w， 会 有 两 条 极 


端的 直线 ， 选 取 b 使 得 要 找 的 直线 为 两 条 极端 直线 “中 间 ” 的 那 条 直线 。 我 们 


使 用 支持 向 量 机 的 时 候 将 所 有 交易 日 看 做 两 类 : 涨 和 跌 ， 在 此 基础 上 我 们 始终 
支持 向 量 机 进行 分 类 。 


2.2.3 加 权 最 小 二 乘 线性 拟 合 


一 般 曲 线 回归 的 方程 为 : 


皇 
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采用 最 小 二 乘法 可 以 给 出 参数 向量 的 估计 , 即 的 估计 值 应 使 下 式 


最 小 。 但 是 在 实际 应 用 中 ,一 般 的 曲线 方程 fCx,B) 的 形式 都 比较 复杂 ,采用 非 


线性 优化 技术 求解 上 式 时 ， 对 初始 点 具有 较 强 的 依赖 性 ， 很 容易 陷入 局 部 最 优 


解 ,从 而 给 估计 带 来 困难 。 为 了 解决 上 述 问 题 ,可 以 采用 加 权 的 最 小 二 乘 线 性 拟 合 : 


即 如 果 存 在 变换 这 样 就 将 转化 为 了 此 时 线性 回归 方程 可 以 表示 为 : 


通过 最 小 二 乘法 对 上 式 进 行 估计 后 再 通过 相应 的 逆 变 换 得 到 原 式 中 的 估计 。 


在 本 文 之 中 ， 使 用 的 所 有 数据 均 来 自 于 wind 软件 (wind 是 一 款 可 以 通 


matlab 对 接 的 十 分 有 效 的 金融 资讯 平台 ) ， 股 票 样本 主要 选取 2014 年 6 月 27 


日 到 2016 年 6 月 27 日 的 时 间 序 列 数据 ， 并 且 选 取 的 是 上 海 交 易 所 上 市 的 公司 。 


我 们 选取 了 如 下 的 干 七 个 指标 作为 回归 数据 的 参考 ， 并 且 对 相关 系数 做 出 了 如 


下 计算 ; 


表 1 指标 和 其 相关 系数 


-和 特征 名 称 。 | 相关 系数 


es iem 一 | 


后 仓 量变 化 
收 基价 发 行 淋 跨 忆 
成 交 额 | 0056889 | 市 8 举 | 0 | 
对 让 | 0.83079 | 市 净 率 | 0 | 
-3 0047961 | 


在 计算 之 后 ， 我 们 选取 相关 系数 最 大 的 十 个 指标 作为 备 选 指标 ， 之 后 采用 


多 因子 模型 和 加 权 多 因子 模型 对 全 市 场 1081 文 股票 分 别 进行 拟 合 ， 下 图 给 


EE 


中 国 石油 、 苏 宁 云 商 、 大 智慧 、 兴 业 银行 、 苏 宁 云 商 和 蒙 草 抗旱 的 预测 曲线 在 
最 近 四 百 多 天 的 价格 的 对 比 图 ， 可 以 看 出 进行 加 权 之 后 多 因子 模型 的 预测 精度 
并 没有 很 大 下 降 ， 但 是 对 于 大 涨 大 跌 时 的 判断 准确 了 许多 。 


之 后 我 们 给 出 中 国 石 油 部 分 指标 和 部 分 预测 值 : 
表 2 中 国 石油 指标 和 预测 值 


村- 、 而 洲 
.2 ) 
4 


| 7.2 | 9075211 | -0.01 | 7.210832695 | 7.2730830 | 


016/5/2 10559126 7. 211223125 7. 272259365 


¢ 016/5/1 13220329 7. 210854445 7. 284880385 
O16/5/13. | 了 本 | 
016/5/1 | 7.2 | 17221805 7. 214203599 7. 275184283 


21040632 7. 205722074 7. 267961657 
016/5/1 7.22 | 14851902 7. 232249578 7. 300071783 


7 


. i 
. 7.2 
016/5/1 7.18 | 16951884 | 0 | 7.193572545 7. 258825453 
016/5/1 28808330 7. 219066752 7. 279707528 
016/5/1 17886829 7. 252208087 7. 322488281 
7.2 
| 7.2 


| 7.2 | 34754111 | -0.12 | 7.22686855 | 7.259769811 | 
2016/5/3 29245563 


上 
72 8 
016/5/20 | 7.17 | 7 
7.18 | 


016/5/1 13713153 7. 20166425 7. 268748139 


TV 
下 
上 由 


之 后 我 们 将 支持 向 量 机 引入 计量 之 中 ， 在 实验 过 程 中 我 们 使 用 了 多 种 核 函 


数 进行 计算 ， 最 终 发 现 二 次 核 函数 的 效果 最 佳 。 在 训练 时 ， 将 涨 的 天 的 指标 , 记 


chinaXiv:201706.00751V1 


为 1， 将 涨 的 天 的 指标 , 记 为 0， 使 用 加 权 回 归 对 模型 进行 求解 ， 得 到 每 一 个 的 


股票 的 预测 值 为 : 。 之 后 对 整个 市 场 中 的 所 有 股票 的 预测 值 进行 排序 ， 取 前 组 
合 数 的 股票 进行 买 入 。 


这 是 从 2016 年 6 月 27 日 往 前 200 天 同时 持 有 100 值 股票 的 带 有 对 冲 的 回 


测 数据 ， 从 收益 上 来 看 获得 了 接近 百 分 之 六 十 的 收益 ， 如 果 能 够 保持 年 化 收益 


应 该 可 以 达到 75% 以 上 。 并 且 这 一 次 回 测 是 以 散户 为 基准 的 ， 所 以 每 天 都 有 干 


分 之 一 的 交易 成 本 ， 如 果 是 机 构 投 资 者 这 一 成 本 将 会 大 大 降低 可 以 获得 更 高 的 
收益 。 
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在 交易 过 程 中 ， 在 开始 的 二 十 天 左右 曲线 具有 较 大 的 起 伏 ， 这 正好 与 2015 


年 下 半年 的 震荡 相 吻 合 ， 而 在 120 天 左右 的 回 撤 与 A 股 市场 在 2016 年 初 的 波 


动 有 关 ， 所 以 虽然 采用 了 对 冲 的 策略 ， 但 是 在 具体 的 投资 过 程 中 往往 没 法 应 对 


股灾 是 情境 。 


为 了 避免 实验 的 偶然 性 ， 我 们 还 对 四 组 数据 每 组 数据 试验 了 60 文 到 150 文 


股票 ， 并 且 每 一 组 收益 都 在 百 分 之 五 十 以 上 。 


4 绪 论 

股票 的 预测 理论 一 直 是 学 者 们 所 关注 的 热点 问题 ， 而 从 传统 统计 学 、 经 济 
学 和 机 器 学 习 等 学 科 都 可 以 提出 种 类 繁多 的 预测 理论 ， 本 文 所 探讨 的 就 是 利用 
一 种 结合 加 权 线 性 回归 和 支持 向 量 机 进行 预测 的 准确 性 和 利用 此 模型 进行 投资 
的 有 效 性 。 

在 本 文 之 中 ， 首 先 我 们 从 投资 时 风险 大 小 的 计量 出 发 ， 考 虑 对 模型 的 惩罚 
应 基于 亏损 的 大 小 ， 因 此 使 用 了 加 权 线 性 回归 对 经 典 的 多 因子 模型 进行 了 改进 ， 
并 且 在 对 权重 进行 合理 考虑 后 发 现 虽 然 表 面 上 看 回归 精度 有 所 下 降 ， 但 是 却 大 
大 提高 了 收益 ， 同 时 另 一 方面 在 加 入 了 支持 向 量 机 对 股票 的 涨 跌 进行 二 分 类 预 
测 后 起 到 了 风 控 的 作用 。 

最 终 从 实用 的 角度 出 发 我 们 获得 了 拥有 较 高 收益 量化 模型 ，， 该 模型 指导 
下 的 投资 不 仅 收 益 可 观 ， 而 且 具 有 很 好 的 稳定 性 ， 适 合 风 险 偏好 型 投资 者 采纳 。 
同时 佐证 了 中 国 证 券 市 场 具 有 弱 有 效 性 。 不 仅 对 现实 之 中 的 优质 选 股 问题 提供 


201706.00751v1 


chinaXiv 


了 一 定 的 方案 ， 同 时 该 问题 还 可 用 到 公司 财务 评估 、 水 质 污 染 计 量 和 土地 资源 
评估 等 各 个 领域 。 
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